İşletmeler için Veri Analitiği - Adımlar


I. Ozkan, PhD


MIS
Çankaya Üniversitesi

iozkan@cankaya.edu.tr

Bahar 2025

Veri Analizi

Veri Bilimi Süreci

Veri Toplama/Kullanımı: İlkeler

Analitikte Veri Kullanım İlkeleri

Veri Dosyası Organizasyonu

Veri Analizi/Madenciliği Adımları

Analitik şu unsurları içermelidir:

- \(Bilgi/Karar \implies \;Eylem\)

Veri Madenciliği (Ne Zaman?)

Birçok Anahtar Kelime

Öğrenme:

Data-Model

İş Dünyasında Verinin Önemi

Keşifsel Veri Analizi



AÇIK TARTIŞMA (BU KONU DAHA SONRA ELE ALINACAKTIR)



Veriden Öğrenme

Denetimli Öğrenme Denetimsiz Öğrenme Pekiştirmeli Öğrenme
{Y;X} mevcut {X} mevcut Örn: Oyun
\(E[Y \: | X]\) Verideki Örüntüler
\(P(Y=y \: |X=x)\) Homojen Gruplar
Örn: Regresyon Örn: Kümeleme

Veri Zengin Ortam: [Çok] Yüksek Boyutluluk

\[Veri=Örüntü(ler)+Hata(lar)\]

Örnek: Standart Regresyon

\[y=\beta_0+\beta_1 x_1+\beta_2 x_2+ \cdots + \beta_k x_k + \varepsilon\]

durumunda bazı \(k>>2\)

yani

\[ y=\underbrace{\beta_0+\beta_1 x_1+\beta_2 x_2+ \cdots + \beta_k x_k}_\text{Örüntü}+\underbrace{\varepsilon}_\text{Hata}\] Başka bir gösterimle

\[\mu(X)=E[Y|X=x]=\hat \beta_0+\hat \beta_1 x_1+\hat \beta_2 x_2+ \cdots +\hat \beta_k x_k\]

\(E[\varepsilon]=0\) ve \(\hat \beta_i\) tahmin edilmiş katsayılar

Nasıl tahmin edilecek, \(\hat \beta_i\):

\(MSE=\frac{1}{N+1} \sum_{i=0}^{N} (y_i-\mu(x_i))^2=\frac{1}{N+1} \sum_{i=0}^{N} \varepsilon_i^2\)

İş Dünyasında

Korelasyon Nedensel İlişki Anlamına Gelmez

Anlamı:

Korelasyon ve Nedensellik tartışılmalıdır

Hata yapısı önemlidir

Modelleme için davranışsal değerlendirmeler kritik öneme sahiptir

Temel Tablo

Veri/Çıkarım Nedensel Öngörücü
Gözlemsel İyi/Kötü İyi/Kötü
Deneysel İyi/Kötü İyi/Kötü

İki değişken düşünelim, \(y\) ve \(x\), ve aralarındaki nedensellik ilişki yapısı için tüm alternatifler:

Nedensellik (Bu Konu Bu Derste Daha Derin Tartışılmayacak)

Bu durumda:

\(X \implies Y\)

\(Y\), \(X\)’e neden olmaz çünkü örneklem şansa bağlı olarak bölünmüştür, bu nedenle şans \(X\)’e neden olur

\(Z\) her ikisine de (mümkün) neden olabilir ancak şansa bağlı olarak

Bu hâlâ şansa bağlı olabilir

Seçime bağlı olabilir, ancak deneyci tarafından dışlanmalıdır

Temel Tablo

Veri/Çıkarım Nedensel Öngörücü
Gözlemsel Kötü İyi
Deneysel İyi Kötü

Test ve Doğrulama



AÇIK TARTIŞMA




Sonraki Adım



Bu ders için kullanılacak yazılım: ve RStudio